PROGRAMME GÉNÉTIQUE

PROGRAMME GÉNÉTIQUE
PROGRAMME GÉNÉTIQUE

Sur Terre, il existe des milliards d’espèces animales et végétales, qui diffèrent les unes des autres par des critères morphologiques et comportementaux. L’information nécessaire à l’établissement de ces critères est inscrite dans le génome , qui est donc propre à chaque espèce. Au sein d’une même espèce, on observe généralement une variabilité entre individus due à un polymorphisme du génome. Ces particularités individuelles sont exploitées, par exemple, par la police scientifique, qui peut formellement identifier un individu à partir de l’analyse du génome des cellules constituant des pièces à conviction (sang, sperme...). De même, les archéologues pourront établir les liens de parenté unissant différents individus retrouvés dans une même tombe, dans la mesure où l’état de conservation des restes permet d’extraire au moins une petite partie du génome.

Au sein d’un individu, toutes les cellules possèdent le même génome car elles proviennent de la division d’une seule et même cellule d’origine: l’œuf. Néanmoins, il existe un grand nombre de types cellulaires, deux cents environ chez l’homme, qui présentent une morphologie et un fonctionnement différents. Cela est dû au fait que dans chaque type cellulaire le génome sexprime de façon différente. On dit que les cellules adultes sont différenciées , par opposition à la cellule œuf originelle, qui est totipotente . L’état différencié est acquis progressivement au cours du développement embryonnaire. Il implique une succession d’événements qui s’enchaînent les uns aux autres dans un ordre déterminé. On aime à comparer l’établissement de cette différenciation cellulaire à l’exécution d’un programme . Le paradoxe est que ce programme, qui conduit en définitive à une expression différentielle du génome, est héréditaire, c’est-à-dire essentiellement inscrit dans le génome lui-même: une graine de haricot se développera toujours en un pied de haricot et un œuf de ver de terre toujours en ver de terre. L’environnement, en l’occurrence le sol pour les exemples choisis, ne modifie pas le programme, du moins dans ses grandes lignes. De plus, le programme génétique d’une cellule donnée ne peut être exécuté que dans le contexte de cette cellule, qui est la seule à contenir tous les éléments moléculaires qui permettent la lecture de tel ou tel gène à tel moment du développement embryonnaire.

Structure du génome des cellules eucaryotes

Concrètement, le génome est un ensemble de molécules d’acide désoxyribonucléique, ou ADN (quarante-six molécules chez l’homme). L’ADN est une macromolécule constituée par l’enchaînement de nucléotides, lesquels sont composés d’un sucre, le désoxyribose, et d’une base [cf. BIOLOGIE MOLÉCULAIRE]. Il n’existe que quatre bases différentes: l’adénine, la thymine, la guanine et la cytosine, notées A, T, G et C. C’est l’ordre d’enchaînement non aléatoire de ces quatre bases qui constitue le message génétique. L’étendue de ce message est considérable: le génome humain contient environ 3 憐 109 bases, ce qui représenterait, écrit avec les seules lettres A, T, G et C un livre de... cinq cent mille pages! Cependant, la taille du génome ne reflète pas nécessairement le degré de complexité ou d’évolution d’un organisme: certaines plantes et certains amphibiens possèdent cent fois plus d’ADN que l’homme. De plus, seulement 10 p. 100 de l’ADN est codant, c’est-à-dire contient l’information nécessaire à la synthèse des protéines, les constituants majoritaires responsables de la structure et de la fonction des cellules. Dans l’ADN, on trouve des séquences classables en trois catégories: les séquences hautement répétées, les séquences moyennement répétées et les séquences uniques. L’ADN hautement répétitif n’est pas codant; sa fonction n’est pas connue; il est regroupé essentiellement dans les centromères et les télomères des chromosomes [cf. CHROMOSOMES]. La majeure partie de l’ADN moyennement répété est également non codant et est constitué de séquences mobiles dispersées dans tout le génome. L’autre partie de l’ADN moyennement répété code des petits ARN, ARN ribosomaux et ARN de transfert, qui sont partie prenante de la machinerie de traduction [cf. BIOLOGIE MOLÉCULAIRE]. Enfin, les séquences uniques représentent les mots clés du message génétique: elles contiennent les séquences codant les protéines. On appelle gène toute séquence d’ADN codant une protéine ou un petit ARN. Plus précisément, le gène ne se limite pas strictement à la partie codante mais comporte aussi les séquences flanquantes nécessaires à son expression et à la régulation de cette expression.

Mécanismes généraux du transfert de l’information

L’ADN est contenu dans le noyau de la cellule, alors que la synthèse des protéines s’effectue dans le cytoplasme. Cela implique donc la mise en jeu d’un intermédiaire, un messager, capable de transiter du noyau vers le cytoplasme. Pour schématiser, le gène est d’abord transcrit en un acide ribonucléique, ou ARN, dit prémessager . L’ARN est très analogue à l’ADN: c’est également une macromolécule constituée d’un enchaînement de nucléotides comportant chacun un ribose (au lieu d’un désoxyribose dans l’ADN) et une base, adénine, guanine, cytosine ou uracile (au lieu de thymine dans l’ADN). L’ARN prémessager représente en fait une copie complémentaire du gène: il est synthétisé par une enzyme, l’ARN-polymérase, qui est capable de positionner dans l’ARN une guanine chaque fois qu’elle lira une cytosine sur l’ADN, une cytosine pour une guanine, un uracile pour une adénine et une adénine pour une thymine. Cet ARN prémessager est ensuite maturé en un ARN messager . En effet, dans le gène, la séquence codante est interrompue par des séquences dites «introniques» dont la fonction est encore mal connue. L’essentiel de la maturation consiste donc à éliminer les introns – on dit «épisser» – pour ne conserver que les séquences codantes, également appelées «exons» (fig. 1). De plus, lors de la maturation, les deux extrémités de l’ARN sont modifiées: en amont est ajouté un «chapeau» constitué par un nucléotide méthylé. Ce chapeau est indispensable à la traduction ultérieure de l’ARN messager. En aval, une enzyme, la poly-A-polymérase, fixe une «queue» formée exclusivement d’adénine. Cette queue confère à l’ARN une certaine stabilité à la dégradation. La maturation de l’ARN messager s’accompagne d’une migration vers le cytoplasme, où la traduction en protéine aura lieu. De même que l’ADN et l’ARN, les protéines sont des polymères constitués par l’enchaînement non aléatoire d’éléments de base, les acides aminés, qui n’existent qu’en nombre limité, une vingtaine. Par conséquent, le langage à quatre lettres de l’ADN est purement et simplement traduit en un langage à vingt lettres. Chaque acide aminé est codé par un triplet de nucléotides. Le code génétique , c’est-à-dire le dictionnaire qui donne la traduction d’un langage dans l’autre, est dégénéré: plusieurs triplets de nucléotides codent le même acide aminé. Cela confère aux cellules une certaine résistance à la mutation: parmi les mutations qui n’affectent qu’une base, seront silencieuses celles pour lesquelles la signification du triplet de nucléotides restera inchangée.

Régulation de la transcription

Historiquement, la première question qui s’est posée était de savoir si au cours de la différenciation cellulaire les différents types de cellules perdent certains gènes de façon différentielle ou si, au contraire, toutes les cellules gardent tous les gènes présents dans l’œuf, leur expression étant différente selon les types cellulaires. La réponse à cette question a été clairement fournie dans les années 1960 par l’équipe de John Gurdon, embryologiste moléculaire à l’université de Cambridge, en Grande-Bretagne. Le principe de ses expériences, réalisées sur une espèce de crapaud sud-africain, Xenopus laevis , est de retirer le noyau d’un œuf et de le remplacer par le noyau d’une cellule différenciée, en l’occurrence d’une cellule intestinale de têtard. Ainsi transformé, l’œuf se développe normalement pour former un têtard viable capable de se métamorphoser. Cela indique donc que le noyau de la cellule intestinale différenciée comporte toujours tous les gènes qui étaient présents dans l’œuf. La différenciation met donc en jeu non pas une élimination différentielle de gènes, mais bien une expression différentielle des gènes. C’est la raison pour laquelle beaucoup d’efforts restent consacrés à la compréhension des mécanismes permettant cette expression différentielle.

Comme nous l’avons vu, la partie codante d’un gène est généralement entourée par des parties non codantes qui participent à la régulation de son expression. On distingue, en amont immédiat de la séquence codante, une séquence dite «promotrice», qui contient des sites de fixation pour l’ARN polymérase, et un certain nombre de facteurs, dits «facteurs généraux de transcription» (fig. 2). Ces acteurs moléculaires assurent un taux basal moyen de transcription qui est susceptible d’être modulé à la hausse ou à la baisse par d’autres facteurs de transcription, dits spécifiques . Ce sont ces facteurs que l’on suppose être responsables de la régulation différentielle de l’expression des gènes. Les facteurs de transcription spécifiques se fixent sur des séquences d’ADN particulières, appelées «séquences consensus», longues de cinq à vingt nucléotides, différentes pour chaque facteur de transcription. Ces séquences sont localisées soit dans la région promotrice elle-même, soit dans des séquences dites stimulatrices de la transcription (enhancer en anglais), localisées en amont ou en aval du gène, parfois très loin de la séquence codante ou, au contraire, directement dans un intron au sein de la séquence codante [cf. GÉNÉTIQUE MOLÉCULAIRE].

Les facteurs de transcription spécifiques sont des protéines constituées de plusieurs domaines à fonction spécialisée. Ils comportent tous, d’une part, un domaine de liaison à l’ADN qui permet à la protéine de reconnaître sa séquence consensus et de s’y fixer et, d’autre part, un domaine capable d’interagir avec l’ARN-polymérase ou les facteurs généraux de transcription et de moduler ainsi leur activité transcriptionnelle. Les facteurs spécifiques de transcription se fixent souvent à l’ADN sous forme d’homodimères ou d’hétérodimères. Pour ce faire, ils disposent d’un domaine de dimérisation qui permet les interactions protéine-protéine. Enfin, certains facteurs de transcription ne sont capables de se lier à l’ADN que lorsqu’ils ont fixé un ligand. C’est le cas des récepteurs nucléaires d’hormones. En absence d’hormones, ces facteurs se localisent dans le cytoplasme de la cellule. Lorsqu’une hormone pénètre dans la cellule, elle se lie à son récepteur qui devient alors capable de migrer dans le noyau et de se lier à l’ADN sur sa séquence consensus.

Il existe des facteurs de transcription capables d’activer la transcription, avec une efficacité variable, d’autres capables de la réprimer. Paradoxalement, certains facteurs de transcription, comme la protéine p53, qui est mutée dans de nombreux cancers humains, ou la protéine Dorsal de drosophile, sont capables d’activer certains gènes et d’en réprimer d’autres. Parmi les répresseurs de transcription, on distingue, d’une part, les répresseurs actifs, qui possèdent la capacité intrinsèque de diminuer le taux de transcription des gènes et, d’autre part, les répresseurs passifs, qui agissent indirectement en diminuant l’activité d’un activateur de transcription. Par exemple, le facteur AP1 réprime l’activité du gène de l’ostéocalcine en entrant en compétition avec le récepteur nucléaire de l’acide rétinoïque, qui est un activateur de transcription. La compétition entre les deux facteurs s’explique par le fait que dans le promoteur de l’ostéocalcine les séquences consensus de fixation du récepteur de l’acide rétinoïque recouvrent partiellement celles du facteur AP1. La liaison d’AP1 sur l’ADN gêne donc celle du récepteur de l’acide rétinoïque. D’autres répresseurs passifs agissent par un mécanisme plus direct. Par exemple, lors de la différenciation des cellules musculaires, le facteur de transcription c-jun , qui est fortement oncogénique chez les vertébrés, se lie au facteur de transcription activateur MyoD, ce qui empêche ce dernier de se fixer à l’ADN, et donc d’activer la transcription.

L’expression de chaque gène est régulée finement grâce au fait que plusieurs facteurs de transcription agissent en combinatoire. En effet, il n’existe qu’un nombre fini et limité de facteurs de transcription, probablement pas encore tous connus aujourd’hui, mais le nombre de combinaisons différentes est infini. Par exemple, le gène de l’albumine, qui ne s’exprime que dans le foie, voit sa transcription régulée par au moins cinq facteurs différents nommés C/EBP, HNF3, NF1, NFY et HNF1, dont trois agissent en deux sites différents sur le promoteur ou l’enhancer. NFY et NF1 sont ubiquitaires, c’est-à-dire qu’ils sont présents dans tous les types cellulaires, tandis que C/EBP et HNF1 sont restreints à un petit nombre de types cellulaires, dont le foie, et HNF3 est spécifique du foie et des poumons. On comprend, avec cet exemple, que déterminer les facteurs de transcription qui interviennent dans l’expression d’un gène ne suffit pas à comprendre comment ce gène est régulé au cours de la différenciation cellulaire puisque, on le voit, certains de ces régulateurs sont eux-mêmes régulés. Il paraît donc important pour comprendre la différenciation cellulaire d’étudier les variations d’expression des gènes qui codent les facteurs de transcription.

Autres niveaux de régulation de l’expression des gènes

Pour qu’un gène soit transcrit et, a fortiori, pour que son taux de transcription soit régulé, il faut que son promoteur et son enhancer soient accessibles à l’ARN-polymérase et aux différents facteurs de transcription. Or, dans le noyau de la cellule, l’ADN est fortement compacté sous forme de chromatine, du fait de son association à un certain nombre de protéines. Le premier niveau d’empaquetage de l’ADN est le nucléosome . Un nucléosome est composé d’un octamère de protéines particulières, les histones, autour desquelles l’ADN effectue deux tours. Chaque nucléosome est attaché au suivant par l’intermédiaire d’une autre histone, ce qui fait que l’ensemble ADN-histones constitue une fibre de 10 nanomètres de diamètre. À son tour, cette fibre s’enroule sur elle-même, comme un solénoïde, pour former une nouvelle fibre plus épaisse de 30 nanomètres de diamètre. En plus des histones, on trouve également associées à l’ADN des protéines HMG (pour high mobility group ). L’état de la chromatine lorsque l’ADN est transcrit est encore mal connu. Ce que l’on sait, c’est que l’ADN transcrit est particulièrement sensible à la dégradation par des nucléases, ce qui indique qu’il est peu protégé par des protéines, et que deux protéines HMG (HMG 14 et HMG 17) s’associent préférentiellement à ces sites sensibles.

La molécule d’ADN est composée de l’union de deux brins, le plus fréquemment enroulés en double hélice droite: c’est la conformation B de l’ADN. Cependant, dans des zones précises de la molécule d’ADN, la double hélice n’est plus droite mais gauche: c’est la conformation Z . Il semblerait qu’une même zone d’une molécule d’ADN puisse passer d’une conformation à l’autre, par exemple au cours du développement embryonnaire, et que ce changement de conformation modifierait le niveau de transcription des gènes situés dans ces zones.

L’ADN peut également être modifié chimiquement. Les modifications les plus fréquentes et les mieux connues sont les méthylations des cytosines. D’une façon générale, il apparaît que plus l’ADN est méthylé, moins il est transcrit. C’est particulièrement évident dans le cas des chromosomes sexuels X. Chez les femelles, un des deux chromosomes X est hyperméthylé; il en résulte qu’il est quasi totalement inactivé [cf. RÉGULATIONS BIOCHIMIQUES]. De plus, il est connu depuis longtemps que les deux allèles d’un même gène, celui issu du père et celui issu de la mère, ne s’expriment pas toujours au même taux. Cette différence d’expression semble due à une «empreinte» acquise par le gène pendant son séjour dans les gamètes. Cette empreinte consisterait essentiellement en une méthylation.

Le niveau d’expression des gènes est également affecté par le devenir des ARN après transcription. En effet, ce qui compte d’un point de vue fonctionnel n’est pas la quantité d’un ARN donné, mais la qualité et la quantité du produit protéique final (fig. 3). Comme nous l’avons vu, le gène est d’abord transcrit en un ARN prémessager qui est ensuite maturé en un ARN messager. Un ARN prémessager donné peut engendrer plusieurs ARN messagers différents qui seront donc traduits en plusieurs protéines apparentées mais différant par un ou plusieurs domaines. Cela est dû au fait que, lors de l’épissage des introns, certains exons peuvent ne pas être pris en compte. On parle d’épissage alternatif. Les différentes isoformes de protéines issues de l’épissage alternatif ont généralement des fonctions analogues, mais dans certains cas peuvent avoir des fonctions totalement différentes. Le meilleur exemple est celui du gène de la calcitonine, qui peut donner naissance par épissage alternatif soit à la calcitonine elle-même, soit à un neurotransmetteur.

La quantité de protéines synthétisées à un moment donné par la cellule dépend bien évidemment de la quantité d’ARN messagers présents. Cette quantité dépend à son tour, d’une part du taux de transcription et, d’autre part, de la stabilité des ARN. Cette stabilité est contrôlée à la fois au niveau du prémessager et du messager. Au niveau du prémessager, elle dépend de la présence, en amont de la séquence codante, de séquences riches en A et en U, qui ont un effet déstabilisant. Au niveau du messager, la stabilité est au contraire renforcée par la présence de la queue poly-A, en aval de la séquence codante.

Enfin, pour qu’une molécule, quelle qu’elle soit, puisse remplir sa fonction normale, il faut qu’elle soit localisée dans le bon compartiment cellulaire. Ainsi, un facteur de transcription ne pourra moduler la transcription de ses gènes cibles que s’il est présent dans le noyau. De même, un ARN ne pourra être traduit que s’il est présent dans le cytoplasme et accessible à la machinerie de traduction. Dès que la transcription est amorcée, l’ARN naissant s’entoure de protéines pour former des particules ribonucléoprotéiques, appelées hnRNP (pour heterogenous nuclear ribonucleoparticles ). On estime que seulement un vingtième des ARN synthétisés quittent le noyau. La moitié de ces ARN seraient dégradés directement dans le noyau et les 30 p. 100 restant y seraient séquestrés, un temps plus ou moins long, par un mécanisme impliquant probablement les protéines des hnRNP, ce qui contribuerait donc à réguler le taux d’expression des gènes correspondants. Le stockage des ARN peut également se faire dans le cytoplasme. Un exemple extrême est celui du stockage des ARN par les ovocytes riches en vitellus, comme ceux de Xenopus laevis . Au cours de l’ovogenèse, ces ovocytes synthétisent et stockent une quantité considérable d’ARN. Ils seront utilisés, parfois plusieurs mois plus tard, au cours des premières divisions de l’embryon précoce, alors que le génome de l’embryon lui-même est silencieux.

Certains facteurs de transcription sont constitutivement présents dans de nombreux types cellulaires mais sont inactifs parce que localisés dans le cytoplasme. C’est le cas du facteur de transcription ubiquitaire NF- B, qui est retenu dans le cytoplasme, par suite de son association à une protéine appelée I B (I pour inhibiteur). Cette protéine possède dans sa séquence en acides aminés un motif répété six fois qui, pense-t-on, lui confère la capacité de se lier au cytosquelette. De ce fait, le complexe NF- B/I B s’ancre dans le cytoplasme. En réponse à un stimulus extracellulaire, tel que certains facteurs de croissance ou certaines interleukines, la protéine I B est phosphorylée; elle se dissocie alors de NF- B puis est dégradée. NF- B se trouve ainsi libéré et peut migrer dans le noyau, où il activera ses gènes cibles. De façon intéressante, un des gènes cibles de NF- B est le gène qui code... I B! Donc, très rapidement, le taux de protéines I B réaugmente dans la cellule, et NF- B se retrouve à nouveau séquestré dans le cytoplasme. Ce mécanisme permet une activation du facteur de transcription NF- B à la fois très rapide – elle ne nécessite ni transcription ni traduction – et transitoire.

La différenciation des cellules musculaires squelettiques

Les cellules musculaires squelettiques sont des cellules géantes qui peuvent atteindre 50 centimètres de long et qui sont multinucléees. Hormis leur taille, elles se distinguent des autres types cellulaires par le fait qu’elles contiennent un certain nombre de protéines spécifiques: l’actine, la myosine, la tropomyosine et la troponine, responsables de la contractibilité des cellules musculaires, la créatine-phosphokinase, une des enzymes du métabolisme particulier des muscles, et le récepteur de l’acétyl-choline, le neurotransmetteur qui commande la contraction de ces cellules.

Les cellules musculaires se forment au début du développement embryonnaire par fusion de nombreuses cellules précurseurs appelées «myoblastes». Dans les myoblastes, les gènes codant les protéines ci-dessus énumérées sont très peu exprimés. La fusion des myoblastes entre eux s’accompagne d’une augmentation du taux d’expression de ces gènes d’un facteur 500 environ. Leur transcription est contrôlée par un facteur de transcription, appelé MyoD1, que l’on ne trouve présent que dans les myoblastes. Si, expérimentalement, on introduit le gène codant MyoD1 dans des fibroblastes, ces cellules, qui normalement constituent le tissu conjonctif, se transforment en myoblastes fonctionnels, c’est-à-dire capables de fusionner et d’exprimer les gènes spécifiques des cellules musculaires. À lui tout seul, le facteur de transcription MyoD1 semble donc capable d’induire la différenciation musculaire. Cependant, il existe d’autres facteurs présentant des homologies de séquences et de fonction avec MyoD1. Il s’agit de la myogénine, de Myf5 et de l’herculine. Ces facteurs ont tous la capacité d’induire des fibroblastes à se différencier en cellules musculaires, ce qui suggère que la régulation de la transcription des gènes caractéristiques de la différenciation musculaire pourrait être sous le contrôle de plusieurs facteurs de transcription qui auraient soit des fonctions redondantes, soit des fonctions plus ou moins spécialisées. Cette dernière hypothèse est soutenue par le fait que Myf5 et MyoD1 sont présents surtout dans les myoblastes, tandis que la myogénine ne s’accumule qu’au moment où la fusion entre myoblastes démarre, alors que l’herculine n’est détectable que dans les myotubes, c’est-à-dire dans des cellules musculaires déjà presque différenciées. Les différents facteurs interviennent donc successivement au cours de la différenciation. Étant donné que Myf5 et MyoD1 interviennent en premier, ils pourraient contrôler la différenciation musculaire non seulement en activant la transcription de certains gènes de différenciation, mais aussi en activant l’expression des autres facteurs de transcription intervenant plus tardivement.

Exemple de différenciation contrôlée par l’environnement extracellulaire

L’exemple de la différenciation musculaire nous oblige à comprendre pourquoi seuls les myoblastes expriment les facteurs de transcription MyoD1 et Myf5. Il faut donc remonter une étape en amont pour expliquer comment se différencient ces cellules précurseurs.

Chez l’œuf de crapaud Xenopus laevis , dont nous avons déjà parlé, on observe une dissymétrie de composition moléculaire du cytoplasme entre le pôle animal, qui s’oriente sous l’effet de la gravité vers le haut, et le pôle végétatif. Il en résulte que les cellules qui se forment par division de cet œuf n’héritent pas toutes du même cytoplasme. Ainsi, dès leur formation, ces cellules sont différentes, bien que leur génome ne se soit pas encore exprimé. Ce dernier ne commencera à s’exprimer qu’à la fin de la segmentation. Si l’on dissocie artificiellement les cellules de l’embryon très précoce de Xénope et si on les place dans un milieu de survie, celles-ci vont se différencier de façon autonome, mais uniquement en deux types cellulaires: en cellules ectodermiques, qui donneront naissance aux cellules nerveuses et aux cellules épidermiques, et en cellules endodermiques, qui donneront l’appareil digestif. Aucune cellule ne se différenciera, dans ces conditions, en cellules mésodermiques, dont sont dérivées les cellules musculaires. Les cellules mésodermiques ne peuvent se former que secondairement, à partir des cellules ectodermiques, et uniquement si celles-ci sont en contact avec des cellules endodermiques. On appelle ce phénomène l’«induction mésodermique». Pour que les cellules mésodermiques soient induites à se différencier, il faut et il suffit que l’ectoderme soit localisé à proximité de l’endoderme, sans cependant qu’un contact direct soit nécessaire. Cela indique que le ou les facteurs inducteurs sont des molécules solubles produites par les cellules de l’endoderme. Il a été démontré que ces inducteurs sont deux facteurs de croissance, le FGF et le TGF 廓. Ces deux molécules sont excrétées dans le milieu par les cellules endodermiques et sont reconnues et «captées» par les cellules ectodermiques, grâce à la présence à leur surface de récepteurs spécifiques. Lorsque ces récepteurs ont lié leur facteur de croissance, il s’ensuit une cascade de réactions biochimiques intracytoplasmiques, principalement des phosphorylations, qui conduisent à une modification d’expression de certains gènes. Il est clair dans cet exemple que la différenciation mésodermique implique un programme qui n’est génétique qu’en partie. Interviennent deux types de facteurs épigénétiques: l’héritage d’une composition cytoplasmique élaborée dans et par l’ovocyte et l’intervention de molécules présentes dans le microenvironnement car synthétisées et excrétées par une autre catégorie cellulaire voisine (fig. 4).

Le programme de développement d’un organisme entier

L’étude de l’induction mésodermique et de la différenciation musculaire nous révèle que la différenciation procède par étapes et que le passage par une étape est indispensable pour que l’étape suivante se déroule: la différenciation de l’ectoderme et de l’endoderme est nécessairement préalable à l’induction mésodermique, laquelle est à son tour un préalable à la différenciation des myoblastes à partir desquels seront générées les cellules musculaires. En clair, le passé d’une cellule conditionne son devenir. Il apparaît donc d’un grand intérêt de pouvoir connaître la filiation d’une cellule.

De par sa petite taille (1 mm) et sa transparence, qui permet de voir les cellules directement sur l’individu vivant, le nématode Caenorhabditis elegans se prête idéalement à l’étude de la différenciation en relation avec la filiation des cellules. Les individus hermaphrodites sont très exactement constitués de mille quatre-vingt-dix cellules somatiques. La filiation de chacune d’entre elles a été précisément décrite: on connaît parfaitement ses sœurs, ses parents, ses grands-parents... Ces travaux ont permis de montrer que, contrairement à ce que l’on aurait pu penser, toutes les cellules d’un même type ne dérivent pas d’un seul et même ancêtre. Généralement, elles tirent leur origine de plusieurs cellules souches qui, bien que situées dans différentes zones de l’embryon, s’engagent dans la même voie de différenciation. À l’inverse, des types cellulaires différents, comme certains neurones et les cellules musculaires, sont issus de précurseurs apparentés qui ont donc exprimé un programme génétique d’abord commun puis divergent.

Le temps de génération de Caenorhabditis est très court: trois jours seulement, ce qui a favorisé l’isolement de très nombreuses mutations. Aujourd’hui, environ huit cents gènes ont été identifiés par mutation pour un nombre total estimé seulement à trois mille. Parmi les huit cents gènes actuellement connus dans cette espèce, on a pu identifier des gènes qui contrôlent le développement et pu comprendre que les cellules procèdent par choix binaires discrets: se diviser ou non, s’engager ou non dans une voie de différenciation, mourir ou non. L’engagement dans une voie de différenciation se fait progressivement, également par choix binaires successifs. Ainsi, quand une certaine catégorie de gènes de développement est mutée, on observe simplement le remplacement d’une ou de quelques cellules par un autre type cellulaire. Ce résultat indique que ces gènes interviennent tardivement dans la différenciation. Au contraire, la mutation d’une autre catégorie de gènes de développement entraîne le changement d’une branche entière de l’arbre généalogique, ce qui démontre que ces gènes interviennent dans des choix précoces. D’autres mutations encore induisent un blocage total d’une voie de différenciation, ce qui se traduit par le fait que, dans une filiation, les cellules continuent à se comporter comme le faisaient leurs parents et grands-parents et que leur descendance se comportera toujours de la même façon. Inversement, certaines mutations accélèrent la différenciation, et, comme les cellules différenciées ont généralement une faible capacité à se diviser, il en résulte que l’adulte est formé prématurément et qu’il est anormalement petit.

Caenorhabditis elegans permet également d’estimer les parts respectives du génome et de l’environnement dans le passage d’une étape de différenciation à une autre. En effet, on peut détruire une unique cellule en utilisant un faisceau laser très fin et observer la façon dont les cellules voisines se développent. Le résultat est que la plupart des cellules poursuivent leur développement normalement. Elles ne seraient donc pas sous le contrôle de signaux émis par leurs voisines. Il existe cependant quelques exceptions notables à cette règle: la différenciation des cellules de la vulve, l’organe de ponte chez Caenorhabditis elegans , en est un bon exemple. La vulve est formée exactement de vingt-deux cellules issues de trois cellules précurseurs. Elle est reliée à la gonade par une cellule ancre. Si l’on détruit la cellule ancre par rayon laser, les trois cellules précurseurs ne se différencient plus en cellules vulvaires mais en cellules hypodermiques, comme leurs voisines. La différenciation vulvaire est donc induite par la cellule ancre, de la même manière que la différenciation mésodermique chez Xenopus laevis est induite par l’endoderme. Si, inversement, les trois cellules précurseurs sont détruites par rayon laser, trois cellules voisines qui normalement se différencient en hypoderme voient leur destinée déviée vers la différenciation vulvaire. Si, à leur tour, les trois cellules remplaçantes sont détruites, aucune autre ne se différenciera en vulve. Il existe donc un nombre limité de cellules sensibles au signal inducteur émis par la cellule ancre. Ces six cellules constituent ce que l’on appelle un «groupe d’équivalence». En situation normale, les cellules remplaçantes ne se différencient pas en cellules vulvaires car elles sont moins bien exposées au signal émis par la cellule ancre que les cellules précurseurs normales. Trois paramètres contrôlent donc la différenciation vulvaire: un paramètre génétique responsable de la sensibilité des cellules au signal inducteur et deux paramètres épigénétiques, la position dans l’espace des cellules et la présence dans le milieu environnant du signal inducteur.

Les modifications expérimentales du programme

Plutôt que d’aborder l’étude du programme génétique de développement en utilisant des mutants naturels au hasard, on peut utiliser des méthodes de génétique inverse qui consistent à modifier expérimentalement chez une souris un gène donné puis à analyser les effets de cette modification sur le développement embryonnaire. Deux types majeurs de modifications peuvent être apportés: soit on rajoute plusieurs copies surnuméraires d’un gène, baptisé transgène, dans une souris qui devient alors «transgénique», soit, au contraire, on supprime ou on mute un gène par recombinaison homologue pour créer une souris dite «nullizygote» [cf. TRANSFERTS DE GÈNES ET TRANSGÉNOSE]. La première technique est surtout utilisée pour étudier la régulation de l’expression des gènes. En effet, on peut modifier ou supprimer les séquences régulatrices du transgène et voir quelles en seront les conséquences sur son expression, dans un type cellulaire donné, à un moment précis du développement. Les souris nullizygotes sont, elles, utilisées pour étudier la fonction d’un gène: à quelles étapes du développement le gène est-il nécessaire? pour quelles cellules? pour quelles fonctions dans ces cellules ? Aucune généralité ne peut être déduite des expériences réalisées par transgénose, les résultats différant tous d’un gène à l’autre. Par contre, de façon surprenante, dans le cas des souris nullizygotes, la suppression ou la mutation d’un gène n’a bien souvent aucun effet majeur sur le développement. Cela révèle que l’organisme est capable de compenser la perte d’un gène, probablement parce que sa fonction est redondante. En effet, si les gènes codant les protéines n’existent qu’en une copie unique par génome haploïde, ils appartiennent généralement à une famille de gènes qui présentent des homologies de séquences et donc probablement de fonctions. Une même fonction serait donc remplie par plusieurs gènes, ce qui n’exclut pas que chaque gène puisse présenter certaines spécificités.

L’oncogenèse: pathologie du programme génétique

Lors de la formation et du développement d’une tumeur, les cellules acquièrent un certain nombre de propriétés qui ressemblent à celles de cellules embryonnaires jeunes: leur capacité de prolifération est accrue, elles perdent leurs caractères différenciés (on dit qu’elles sont transformées) et elles acquièrent, dans le cas des tumeurs invasives et métastasiantes, la capacité à migrer. Cet état est dû à une modification de certains gènes cellulaires, que l’on a appelés «oncogènes». Lorsque ces gènes fonctionnent normalement, le programme de développement ainsi que le programme qui permet le maintien de l’état différencié se déroulent normalement. Lorsque au contraire un ou quelques-uns de ces gènes sont mutés ou si leur niveau d’expression se trouve modifié, alors la cellule devient tumorale.

Plus d’une centaine d’oncogènes ont aujourd’hui été identifiés, et l’on s’aperçoit qu’ils interviennent à tous les niveaux de la vie des cellules, depuis l’émission de signaux jusqu’à la régulation de l’expression des gènes. Par exemple, l’oncogène sis code un facteur de croissance (le P.D.G.F.), c’est-à-dire une protéine excrétée dans le milieu extracellulaire capable d’aller se fixer à des récepteurs spécifiques présents à la surface d’autres cellules. Comme on l’a vu, la fixation du récepteur sur le ligand enclenche une cascade de phosphorylations intracellulaires qui conduiront la cellule à se diviser. On comprend bien que si le facteur de croissance est muté ou surexprimé, la prolifération des cellules ne sera plus contrôlée normalement. D’autres oncogènes codent directement les récepteurs des facteurs de croissance ou d’hormone. Par exemple, l’oncogène erbB code le récepteur de l’EGF, un facteur de croissance synthétisé par les cellules épithéliales, et ros code le récepteur de l’insuline. À nouveau, si ces récepteurs sont mutés ou surexprimés, le signal sera mal compris et le taux de prolifération des cellules sera modifié. En continuant dans cette logique, on s’attend à ce que tous les gènes impliqués dans la cascade de transduction du signal ainsi que tous les facteurs de transcription soient potentiellement oncogènes. Cela semble être en effet le cas: beaucoup d’oncogènes, src , abl , raf , ras , etc., codent des protéine-kinases, c’est-à-dire des enzymes capables de phosphoryler d’autres protéines, impliquées dans la cascade de transduction du signal mitogène. D’autres oncogènes, comme myc , jun , fos , rel codent des facteurs de transcription capables de moduler la prolifération des cellules.

La mort cellulaire programmée

La formation du millier de cellules de l’adulte de Caenorhabditis s’accompagne par la formation et la mort de cent trente et une cellules surnuméraires. Ces morts cellulaires sont précisément contrôlées: dans le développement normal de tous les animaux, ce sont toujours les mêmes cellules qui meurent, au même emplacement et au même moment du développement. Les cellules mortes sont éliminées par leurs voisines, qui les phagocytent. Ce phénomène, appelé «mort cellulaire programmée» ou apoptose, n’est pas spécifique à Caenorhabditis mais semble concerner l’ensemble du monde vivant. Son incidence est multiple. Au cours du développement embryonnaire, elle contribue, entre autres, à sculpter la forme de l’embryon. Par exemple, chez les vertébrés supérieurs, le bourgeon de membre est d’abord une petite palette plate et pleine au sein de laquelle les cartilages vont se différencier. Les doigts ne s’individualiseront que secondairement par une élimination spécifique des cellules du mésenchyme interdigital. La mort cellulaire programmée est également le mécanisme qui permet d’éliminer les neurones qui ont établi des synapses avec des cellules cibles ne correspondant pas à leurs cellules cibles normales. C’est aussi par ce mécanisme que sont éliminés les lymphocytes ayant développé des anticorps anti-soi. Cette mort cellulaire est programmée au sens où elle intervient à des moments précis du développement, en des zones précises de l’embryon et en mettant en jeu un programme génétique spécifique. Lorsqu’elles meurent, les cellules acquièrent progressivement une morphologie typique: le cytoplasme et le noyau se condensent, les organites cytoplasmiques comme les mitochondries et les lyzosomes restent intacts, puis les membranes plasmique et nucléaire s’invaginent, ce qui conduit à la fragmentation de la cellule en corps apoptotiques. Parallèlement, l’ADN est dégradé par une endonucléase qui agit préférentiellement au niveau des liens internucléosomiques, là où l’ADN n’est pas protégé par les histones. Les études de mutants de Caenorhabditis ont permis jusqu’à présent de définir onze gènes impliqués dans le mécanisme d’apoptose. Deux de ces gènes sont nécessaires au démarrage du programme de mort, un autre au contraire protège les cellules de la mort, et enfin les huit derniers s’expriment plus tardivement et permettent à la cellule d’acquérir sa morphologie de cellule mourante et, en particulier, d’exprimer à sa surface les protéines qui permettront aux cellules voisines de les reconnaître et de les éliminer.

L’ambiguïté de la notion de programme

La notion de programme génétique a été proposée dans les années 1970 afin de conceptualiser ce que l’on commençait tout juste à comprendre des mécanismes moléculaires régissant la différenciation cellulaire et le développement embryonnaire. Elle a émergé bien sûr des grandes découvertes de la biologie moléculaire, de la biochimie et de la génétique, mais aussi des concepts et techniques utilisés en informatique. Cette notion était tellement séduisante qu’elle s’est imposée, peut-être dangereusement, comme un dogme central.

En réalité, la comparaison entre un organisme vivant et un ordinateur tourne court assez rapidement. Seule la transcription d’un gène pris isolément correspond formellement à la lecture d’un programme en informatique. D’ailleurs, les chercheurs utilisent très fréquemment cette possibilité de pouvoir faire transcrire et traduire un gène eucaryote en dehors du contexte cellulaire, en l’introduisant soit dans un système artificiel totalement reconstitué, soit dans une bactérie. Les choses se compliquent nettement lorsqu’on se place dans le contexte tissulaire normal. En effet, le décodage du message génétique est effectué par un ensemble de protéines qui sont elles-mêmes synthétisées uniquement si une partie du message génétique a été lue! De plus, ces protéines changent quantitativement et qualitativement au cours du développement embryonnaire, donc au fur et à mesure que le vaste programme censé diriger le développement est lu. Par conséquent, on se retrouve dans une situation où l’ordinateur permettant la lecture du programme évoluerait au fur et à mesure de cette lecture. En outre, plusieurs exemples nous ont montré que la lecture du programme dans une cellule peut permettre à celle-ci de modifier l’environnement de ses voisines, lesquelles verront alors en réponse leur programme se modifier. C’est probablement ce type de mécanisme qui permet un développement coordonné et synchronisé à l’échelle de l’organisme entier.

Enfin, il faut savoir que le programme génétique est capable de se diversifier au cours de la vie d’un individu, soit au hasard, soit pour remplir une fonction particulière. Les modifications au hasard peuvent survenir aussi bien dans les cellules somatiques que dans les cellules germinales et sont alors transmises à la descendance. L’environnement (rayons U.V., substances chimiques) ainsi que le mécanisme de réplication de l’ADN sont sources de nombreuses mutations au hasard. Cependant, celles-ci interviennent à très basse fréquence car elles sont généralement réparées par un ensemble d’enzymes constituant ce que l’on appelle le système S.O.S. D’autres modifications au hasard interviennent à fréquence plus élevée. Elles sont dues au déplacement de petites séquences mobiles, les transposons et les rétrotransposons, qui sont capables de s’exciser du génome et d’aller se réinsérer à peu près n’importe où. Leur transposition est source d’évolution: s’ils s’insèrent dans un gène, celui-ci deviendra probablement non fonctionnel. Au contraire, s’ils s’insèrent dans un promoteur ou un enhancer, on peut imaginer qu’ils modifient le niveau d’expression du gène. Plusieurs cas de maladies génétiques s’expliquent par des insertions de séquences mobiles. Par exemple, l’hémophilie A est due à l’insertion d’un rétrotransposon dans le gène du facteur VIII, un facteur de coagulation. De même, une des causes de la myopathie de Duchenne est l’inactivation par insertion du gène de la dystrophine. Les transposons et rétrotransposons sont des séquences fortement répétées. De ce fait, ils permettent des événements de recombinaison entre chromosomes non homologues. Ainsi s’explique la stérilité mâle XX, dans laquelle une partie du chromosome Y a été remplacée par recombinaison par un fragment de chromosome X. Le séquençage de l’ADN au site de recombinaison a montré que l’événement a eu lieu au niveau d’une séquence transposable répétée. À côté de ces modifications au hasard souvent pathogènes, d’autres modifications du génome sont contrôlées et nécessaires au bon fonctionnement de l’organisme. C’est le cas, par exemple, de la diversification des gènes des immunoglobulines. Les anticorps, ou immunoglobulines, sont les protéines produites par le système immunitaire destinées à lutter contre les diverses infections dont nous sommes l’objet. Les cellules du système immunitaire sont même capables de produire des anticorps contre des molécules synthétiques n’existant pas dans la nature. Cette diversité et cette adaptabilité, qui ne peuvent s’expliquer par l’existence d’un nombre infini de gènes codant un nombre infini d’immunoglobulines, est due à un réarrangement entre les gènes qui codent les parties variables des immunoglobulines et ceux qui codent les parties constantes. L’analyse des modalités de ce réarrangement a permis de calculer que le nombre possible d’immunoglobulines (de classe M) différentes est d’environ 1012. Ce chiffre est bien supérieur au nombre d’anticorps différents que l’on peut trouver chez un homme à un moment donné, qui est de l’ordre de quelques millions.

Ainsi, le génome n’est pas aussi immuable qu’on le pensait encore vers le milieu du XXe siècle. Sa stabilité est pourtant suffisante pour maintenir les caractères essentiels d’une espèce sur plusieurs dizaines de milliers d’années (et parfois beaucoup plus!). Cependant, il est clair que le développement d’un organisme ainsi que son maintien à l’état adulte sont sous la dépendance d’un programme génétique souple, capable d’intégrer différents signaux de l’environnement et de se diversifier au cours du temps.

Encyclopédie Universelle. 2012.

Игры ⚽ Поможем написать курсовую

Regardez d'autres dictionnaires:

  • Programme génétique — Ernst Mayr semble être le premier à avoir introduit en biologie la notion de programme génétique en 1961[1]. Elle a rapidement été incorporée au dogme central de la biologie moléculaire ( central dogma of molecular biology ). Mais bien qu elle… …   Wikipédia en Français

  • programme — [ prɔgram ] n. m. • 1677 « description détaillée d un cours; sujet d un concours »; rare av. XIXe; gr. programma « ce qui est écrit à l avance » 1 ♦ Écrit annonçant et décrivant les diverses parties d une cérémonie, d un spectacle, etc. Programme …   Encyclopédie Universelle

  • GÉNÉTIQUE — À quelques rares exceptions près, il n’est nul besoin d’être un biologiste professionnel pour discerner au premier coup d’œil un être vivant d’un objet inerte. Cette identification est liée à la perception d’un petit nombre d’attributs familiers …   Encyclopédie Universelle

  • Genetique — Génétique De la molécule d ADN à la cellule vivante. La génétique (du grec genno γεννώ = donner naissance) est la science qui étudie l hérédité et les gènes. Une de ses branches, la génétique formelle ou mendélienne, s intéresse à la transmission …   Wikipédia en Français

  • Genétique — Génétique De la molécule d ADN à la cellule vivante. La génétique (du grec genno γεννώ = donner naissance) est la science qui étudie l hérédité et les gènes. Une de ses branches, la génétique formelle ou mendélienne, s intéresse à la transmission …   Wikipédia en Français

  • Génétique — De la molécule d ADN à la cellule vivante. La génétique (du grec genno γεννώ, « donner naissance ») est la science qui étudie l hérédité et les gènes, c´est une sous discipline de la biologie. Une de ses branches, la génétique formelle… …   Wikipédia en Français

  • Programme — Cette page d’homonymie répertorie les différents sujets et articles partageant un même nom. Sur les autres projets Wikimedia : « Programme », sur le Wiktionnaire (dictionnaire universel) Le mot programme (du grec programma affiche) …   Wikipédia en Français

  • Programme Carte d'Identité des Tumeurs — Programme Cartes d identité des tumeurs Pour les articles homonymes, voir CIT. Échantillons tumoraux contenus dans la base de données du programme répartis par type de cancer …   Wikipédia en Français

  • Programme Carte d'Identité des umeurs — Programme Cartes d identité des tumeurs Pour les articles homonymes, voir CIT. Échantillons tumoraux contenus dans la base de données du programme répartis par type de cancer …   Wikipédia en Français

  • Mélange génétique — Génétique De la molécule d ADN à la cellule vivante. La génétique (du grec genno γεννώ = donner naissance) est la science qui étudie l hérédité et les gènes. Une de ses branches, la génétique formelle ou mendélienne, s intéresse à la transmission …   Wikipédia en Français

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”